腾讯发布SpecExit算法,无损压缩端到端加速2.5倍!解决大模型长思考效率难题
以 DeepSeek-R1 等为代表的推理模型(Large Reasoning Models, LRMs),通过生成更长的思维链,在各类复杂任务中取得了更优的表现。但长思维链是推理模型的 “双刃剑”,虽能提升性能,但 “过度思考” 带来的语义冗余会大幅推高推理
模型 算法 端到端 specexit specexit算法 2025-10-24 11:39 4
以 DeepSeek-R1 等为代表的推理模型(Large Reasoning Models, LRMs),通过生成更长的思维链,在各类复杂任务中取得了更优的表现。但长思维链是推理模型的 “双刃剑”,虽能提升性能,但 “过度思考” 带来的语义冗余会大幅推高推理
模型 算法 端到端 specexit specexit算法 2025-10-24 11:39 4